AI资讯新闻榜单内容搜索-Claude

超越Claude Mythos和GPT-5.5！斯坦福Agent验证框架拿下SOTA，Transformer作者转发

Transformer论文作者Lukasz Kaiser以及GAN作者Bing Xu转发关注了一项工作——LLM-as-a-Verifier验证框架，该方法是一种通用的验证机制，可与任意Agent Harness和模型结合。

来自主题: AI技术研报

8837 点击 2026-04-27 15:18

Anthropic 做了个 Agent 版闲鱼

Anthropic 搞了一个 Agent 版闲鱼：人只负责说自己想卖什么、想买什么，后面的发帖、砍价、还价、成交，全交给 Claude。然后这事真成了，69 个 Claude agent 在办公室里做成了 186 笔交易，总价值 4010 美元。最后，人真把滑雪板、键盘、书、乒乓球这些东西带到办公室，按 Claude 谈好的结果交换

来自主题: AI资讯

9265 点击 2026-04-27 01:51

Anthropic 产品负责人：从 6 个月到 1 天的发版秘密，harness 会被模型当早餐吃掉

最近，Lenny Rachitsky 请到了 Kat Wu，Anthropic Claude Code 和 Cowork 的产品负责人，访谈了一期播客。节目信息密度相当高，从 PM 角色的变化、Anthropic 的内部流程，到源码泄露事件和 OpenClaw 决策，全都聊了个遍。

来自主题: AI资讯

6057 点击 2026-04-26 12:10

主流AI IDE的token成本爆炸？试试登上GitHub日榜的Claude Context！

欢迎大家尝试前不久GitHub的日榜榜首项目——Claude Context。通过在AI coding场景引入混合检索，Claude Context相比使用grep的原生 Claude Code 能大幅提升检索精度和效率，减少约 40% 的不必要Token 消耗。

来自主题: AI资讯

7922 点击 2026-04-25 13:32

DeepSeek V4 发布，全网最细解读 & 技术报告拆解

Agentic Coding 评测里 V4-Pro 已经到当前开源最佳水平。DeepSeek 公司内部已经把 V4 作为默认编码模型，反馈是优于 Sonnet 4.5，交付质量接近 Opus 4.6 的非思考模式，和 Opus 4.6 的思考模式还有差距。这次还专门为 Claude Code、OpenClaw、OpenCode、CodeBuddy

来自主题: AI技术研报

10195 点击 2026-04-24 16:28

Claude Code 推出 /ultrareview 超级审查功能，20 美金一次，10 分钟干完

今天介绍 Claude Code 上线的一个新功能：/ultrareview。一句话概括：它会在云端同时派出多个 AI 审查员，帮你在合并代码之前把 Bug 揪出来。这个功能其实在上周 Claude Opus 4.7 发布时就提到了，当时 Anthropic 在发布公告里写的是：

来自主题: AI资讯

8887 点击 2026-04-24 10:39

GPT-5.5来了！全榜第一碾压Opus 4.7，OpenAI今夜雪耻

就在刚刚，奥特曼深夜掷出GPT-5.5！全方位暴击Claude Opus 4.7，重新夺回地表最强王座。从写代码到搞科研，AI独立接管电脑的时代真的来了！

来自主题: AI资讯

10409 点击 2026-04-24 08:17

历史性时刻！Anthropic估值暴涨破万亿美元，首次超越OpenAI

Anthropic 在私募二级市场被追到接近 1 万亿美元，热度反超 OpenAI，背后是稀缺股权、收入增长、Claude Code 的产品势能，以及资本对 AI 平台入口的重新下注。

来自主题: AI资讯

7015 点击 2026-04-23 15:19

Claude总觉得自己有意识！Anthropic AI研究员：Claude产生意识可能性在1~70%；曝Mythos模型服从内部宪章；马斯克曾公开反对AI“宪章”

“Claude 和许多模型在不需要太多诱导的情况下，就会陷入‘有某种东西是我，我感觉非常有意识’的这种状态。”

来自主题: AI资讯

9844 点击 2026-04-23 10:05

今天，Anthropic偷偷移除了Pro用户的Claude Code访问权

就在今天，Anthropic 一度偷偷地将 Claude Code 从 Pro 套餐页面移除，引发开发者广泛不满。数小时后，官网页面回滚，负责人称本次仅为小范围测试。但本次事件传递出的信号十分明确：高消耗的 AI 编程代理正逼迫平台重写订阅规则，Claude Code 转向 Max 或按量计费的可能性正在上升。

来自主题: AI资讯

7371 点击 2026-04-22 17:32